# import pandas as pd
# df = pd.DataFrame({'商品':['苹果','香蕉','梨','香蕉'],
#                    '单价(元)':[4,5,4,5],
#                    '销量(kg)':[100,120,105,120],
#                    '库存(kg)':[50,60,70,60]})
# print('原始数据:\n',df)
# # print('检查所有列的重复值:\n',df.duplicated())
# # print('检查单价列的重复值,标记除包含重复值的第一行外其他包含重复值的行为True:\n',df.duplicated('单价(元)'))
# # print('检查单价列的重复值,标记除包含重复值的最后一行外其他包含重复值的行为True:\n',df.duplicated('单价(元)',keep='last'))
# # print('检查单价列的重复值,标记所有包含重复值的行为True:\n',df.duplicated('单价(元)',keep=False))
# # print('删除单价列除包含重复值的第一行外其他包含重复值的行:\n',df.drop_duplicates('单价(元)'))
# # print('删除单价列除包含重复值的最后一行外其他包含重复值的行:\n',df.drop_duplicates('单价(元)',keep='last'))
# # print('删除除完全重复的第一行外其他完全重复的行:\n',df.drop_duplicates())
# # print('删除所有完全重复的行:\n',df.drop_duplicates(keep=False))
# # print('删除所有完全重复的行,并重新设置连续行索引:\n',df.drop_duplicates(keep=False,ignore_index=True))
import numpy as np
import pandas as pd
arr = np.arange(1,10).reshape(3,3)
df1 = pd.DataFrame(arr,columns=['a','b','c'])
df1.insert(0,'key',['001','003','002'])
print('左对象原始数据df1:\n',df1)
arr2=np.arange(10,14).reshape(2,2)
df2=pd.DataFrame(arr2,columns=['a','e'])
df2.insert(0,'key',['001','004'])
print('右对象原始数据df2:\n',df2)
df3=pd.merge(df1,df2,how='left')